import java.io.*;
import java.util.regex.Matcher;
import java.util.regex.Pattern;

/**
 * 描述：
 */
public class RegexSample {
    public static void main(String[] args) {
        StringBuffer content = new StringBuffer();
        try {
            FileInputStream fils = new FileInputStream("D:\\IdeaProjects\\regex\\web\\sample.html");
            // 二进制流转为字符串流
            InputStreamReader isr = new InputStreamReader(fils,"UTF-8");
            // 提高读取效率
            BufferedReader bufferedReader = new BufferedReader(isr);
            String lineTest = "";
            while ((lineTest = bufferedReader.readLine()) != null){
//                读取文件内容
//                System.out.println(lineTest);
                content.append(lineTest + "\n");
            }
            bufferedReader.close();
            System.out.println(content);
        } catch (Exception e) {
            e.printStackTrace();
        }
        // 正则表达式类
        // 创建正则表达式对象
        Pattern p = Pattern.compile("<li>([\\u4e00-\\u9fa5]{2,10})([a-zA-Z]+)</li>");
        // 匹配正则表达式
        Matcher m = p.matcher(content);
        // 查找匹配的结果
        while (m.find()){
//            System.out.println(m.group(0)); // 完整信息
//            System.out.println(m.group(1)); // 第一个分组
//            System.out.println(m.group(2)); // 第二个分组
            /**
             * m.group(x) 返回字符串
             */
            System.out.println(m.group(1)+"=="+m.group(2));
        }
    }
}
